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摘 要 : 以 往 的 语音 统计 学 习 研 究 中 ， 目 标 词 的 词 频 和 转换 概率 都 显著 高 于 跨 界 词 或 非 词 ， 
学 习 效应 的 来 源 并 不 明确 。 为 考察 转换 概率 在 统计 学 习 中 的 独立 效应 , 实验 一 采用 2( 词 长 : 
音节 ， 三 音节 ) X3 GHANA: 目标 词 和 跨 界 词 ， 目 标 词 和 非 词 ， 跨 界 词 和 非 词 ) 的 
被 试 内 设计 , 结果 发 现 , 被 试 在 三 音节 跨 界 词 和 非 词 迫 选 对 中 的 正确 率 显著 高 于 两 音节 相应 
迫 选 对 , 在 三 音节 目标 词 和 跨 界 词 迫 选 对 中 的 正确 率 边 缘 显 著 低 于 两 音节 相应 迫 选 对 。 EK 
验 二 中 ,以 音节 为 单位 随机 拼接 人工 语 言 , 发 现 被 试 对 实验 一 中 所 有 类 型 的 词语 均 未 产生 学 
习 效 应 ,由 于 实验 一 中 对 比 情况 仪 有 转换 概率 有 所 区 别 , 实验 二 排除 了 音节 组 合 偏好 的 干扰 ， 


因此 本 研究 证 明了 转换 概率 在 统计 学 习 中 的 独立 作用 。 


关键 词 ， 转 换 概率 ， 词 频 ， 统 计 学 习 ， 迪 选任 务 


1 引言 


统计 学 习 指 个 体能 够 从 外 界 输入 的 时 间 信息 和 空间 信息 中 发 现 统计 信息 并 以 此 信息 学 


习 新 事物 的 过 程 〈 于 文 勃 等 ， 


2021a, 2021b; Saffran et al., 1996; Frost et al., 2020)， 统 计 学 


习 被 认为 是 人 类 的 一 项 重要 认 知 能 力 ， 和 口语 词 切 分 、 词 汇 语义 习 得 等 方面 都 有 较 强 的 联系 


( Bogaerts et al., 2020; Raviv & Amon, 2018; Saffran & Kirkham, 2018; Newport, 2016; 


Siegelman, 2020; Estes et al., 2007, 2015 )。 虽 然 统 计 学 习 机 制 在 不 同 模 态 下 都 有 一 定 的 表现 ， 


但 在 语音 模 态 下 的 研究 最 为 充分 (Mirman et al., 2008; Gómez et al., 2017; Wang & Saffran, 


2014)。 由 前 向 后 的 转换 概率 (transitional probability, TP) 是 统计 学 习 中 核心 的 概率 信息 之 


一 ， 其 计算 公式 为 : 


TP 


aln = frequencyXY / frequency X 


or 


FER A EA Fg A VA GE ae eT) PRS AR TPS RARE HAA WILKIE 
更 加 牢固 ， 达 到 学 习 的 目的 。 在 编制 实验 材料 过 程 中 ， 目 标 词 会 按照 一 定 的 规律 进行 伪 随 机 


拼接 ， 并 作为 一 个 整体 出 现 ， 它 们 内 部 相连 音节 的 转换 概率 较 高 ， 如 在 图 1 中 ， 每 个 字母 代 
表 一 个 音节 ， 目 标 词 ABC 内 部 AB 和 BC 的 转换 概率 为 1， 而 两 个 目标 词 间 前 后 连接 的 音 


节 组 合 被 称 作 跨 界 词 ， 由 了 


目标 词 ABC 后 会 随机 出 现 其 他 目标 词 下 L、GHI 或 DEF， 因 此 


跨 界 词 CJ 中 前 两 个 音节 的 转换 概率 为 13， 后 两 个 音节 的 转换 概率 仍旧 为 1。 在 学 习 阶 段 
后 ， 对 被 试 的 学 习 效果 进行 测试 ， 如 果 被 试 能 够 区 分 目标 词 和 跨 界 词 或 非 词 〈 非 词 由 不 同 目 
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标 词 的 音节 拼接 而 成 ， 内 部 转换 概率 和 词 频 均 为 0)， 那 么 就 认为 出 现 了 学 习 效应 。 


-ABC-JKL-ABC- GHI-DEF-JKI- 


IN 、、 


目标 词 ” 跨 界 词 跨 界 词 。” 目标 词 
TP=1 TP= (0.33+1) /2 TP= (1+0.33) /2 TP=1 
图 1 语音 统计 学 习 材 料 示 意图 
来 自 婴 幼儿 、 成 人 和 二 语 学 习 者 的 实验 都 验证 了 统计 学 习 机 制 的 假设 〈Saffran et al., 


1996; Estes et al., 2015; Estes & Lew-Williams, 2015; Erickson, Thiessen, & Estes, 2015; Potter, 
Wang, & Saffran, 2017)， 但 很 少 提 及 个 体 是 不 是 只 依靠 转换 概率 进行 学 习 的 。 如 上 图 所 示 ， 
虽然 目标 词 的 转换 概率 明显 高 于 跨 界 词 , 但 是 它们 在 人 工 语言 中 出 现 的 频次 也 更 高 , 假设 使 
14 个 无 意义 三 音节 目标 词 合 成 人 工 语言 , 目标 词 间 拼 接 处 所 形成 的 跨 界 词 转换 概率 为 0.33， 
那么 当 每 个 目标 词 出 现 100 次 时 ， 跨 界 词 (CJK，HID) 在 人 工 语言 中 出 现 的 次 数 为 100X 
0.33=33， 也 就 是 说 目标 词 和 跨 界 词 在 转换 概率 和 词 频 两 个 概率 信息 上 都 有 明显 的 区 别 ， 转 
换 概率 和 词 频 的 复杂 关系 导致 我 们 无 法 给 出 转换 概率 是 否 能 够 独立 影响 统计 学 习 效应 的 证 
据 。 

一 些 研究 试图 在 分 离 词 频 因素 后 考察 转换 概率 对 学 习 效 应 的 影响 (Estes, 2012; Aslin et 
al., 1998)。 在 婴 幼 儿 实 验 中 , 研究 者 通常 是 在 拼接 和 人工 语 言 过 程 中 将 一 半 的 目标 词 呈现 次 数 
减 半 , 随后 在 转 头 偏好 任务 中 , 仅 将 高 频 目标 词 组 合成 的 跨 界 词 和 低频 目标 词 作 为 测试 材料 ， 
由 于 它们 在 人 工 语言 中 的 词 频 相 同 ,因此 如 果 婴 儿 表 现 出 去 习惯 化 效应 ,那么 就 可 以 证 明 个 
体 只 依靠 转换 概率 就 可 以 完成 统计 学 习 任 务 。 此 外 ，Endress 和 Langus (2016) 通过 对 比 多 
个 实验 的 结果 发 现 转换 概率 在 影响 统计 学 习 的 效应 应 该 大 于 频次 。 然 而 , 为数 不 多 的 研究 仍 
旧 存 在 一 些 不 足 之 处 。 首 先 ， 大 多 数 研究 在 拼接 人 工 语言 时 都 采用 相等 长 度 的 目标 词 (两 音 
节 或 三 音节 )， 这 一 方面 并 不 符合 自然 语言 词 长 不 等 的 情况 (Frost etal.,2020)， 而 且 会 导致 
在 学 习 阶段 初期 被 试 就 产生 节奏 期 待 , 很 容易 就 发 现 所 有 词语 都 是 相等 长 度 的 ,从 而 夸大 学 
习 效应 CHoch et al., 2013 )。 其 次 ， 由 等 长 度 目标 词 合 成 的 人 工 语言 大 大 限制 了 测试 词语 转 
换 概率 的 变化 范围 。 以 由 4 个 三 音节 目标 词 合 成 人 工 语言 为 例 ， 所 有 跨 界 词 的 转换 概率 为 
0.67〈(1+0.33) /2)， 目 标 词 转换 概率 为 1， 在 迫 选 任务 〈 转 头 偏好 任务 ) 中 只 能 考察 这 一 种 
对 比 情况 ; 然而 ， 如 果 转 换 概率 确实 可 以 独立 影响 学 习 效应 ， 那 么 在 目标 词 、 跨 界 词 和 非 词 
两 两 组 成 迫 选 对 中 ， 被 试 的 迫 选 正确 率 会 有 所 不 同 ， 但 目前 还 没有 见 到 这 方面 的 实证 研究 。 
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最 后 ， 于 文 勃 等 2021lb) 采用 组 间 设 计 的 方法 考察 转换 概率 的 独立 效应 ， 在 实验 中 通过 增 
加 填充 词语 来 降低 词语 的 转换 概率 ,从 而 保证 选项 在 词 频 信息 上 没有 区 别 , 而 仅 在 转换 概率 
上 有 所 不 同 。 虽然 在 成 人 实验 中 发 现 转换 概率 的 提高 能 够 促进 统计 学 习 效 应 , 但 是 这 一 研究 
中 高 低 转 换 概率 是 组 间 变 量 , 高 转换 概率 条 件 下 的 学 习 时 间 较 短 , 低 转 换 概率 条 件 下 由 于 增 
加 了 填充 词 而 导致 学 习 时 间 较 长 ， 该 条 件 的 目标 词 在 记忆 系统 中 受到 了 更 多 的 干扰 和 捉 秆 
所 以 学 习 效 应 较 低 的 解释 原因 也 不 唯一 。 

本 研究 通过 设计 混合 长 度 的 目标 词语 来 解决 以 上 问题 。 首 先 ， 我 们 采用 两 音节 和 三 音 
节目 标 词 拼接 成 混合 长 度 的 人 工 语言 , 在 迫 选 任务 中 将 分 别 设置 两 种 长 度 的 目标 词 、 跨 界 词 
和 非 词 ， 在 相同 长 度 前 提 下 进行 两 两 配对 形成 三 种 迫 选 对 类 型 〈 目 标 词 和 跨 界 词 迫 选 对 ， 目 
标 词 和 非 词 迫 选 对 ， 跨 界 词 和 非 词 迫 选 对 )。 保 证 每 一 个 迫 选 试 次 中 两 个 选项 长 度 相同 的 原 
因 是 普通 话 母语 者 存在 韵律 期 待 ， 偏 好 双 音 节 结 构 于 文 勃 等 ，2021b; 裴 雨 来 ， 2016)。 其 
次 , 我 们 重点 对 比 被 试 在 不 同 长 度 条 件 下 相应 迫 选 对 的 正确 率 差 异 , 这 是 因为 在 两 音节 的 目 
标 词 和 跨 界 词 迫 选 对 中 ,两 个 选项 在 词 频 和 转换 概率 上 都 有 差异 , 但 是 词 频 的 差异 在 三 音节 
的 概率 迫 选 对 中 仍旧 存在 , 因此 当 我 们 再 比较 同类 迫 选 对 在 不 同 长 度 下 的 正确 率 差异 时 , 就 
可 以 分 离 出 转换 概率 的 独立 效应 〈 六 类 人 迫 选 选项 的 词 频 和 转换 概率 详 见 表 1)。 最 后 ， 本 研 
究 的 两 个 实验 都 是 被 试 内 设计 , 所 有 被 试 均 完 成 相同 的 学 习 任 务 , 因此 不 会 因为 学 习 时 间 长 
短 不 同 带 来 额外 变量 。 在 实验 一 中 , 我 们 以 目标 词 为 单位 合成 人 工 语言 ,虽然 目标 词 都 是 由 
无 意义 音节 组 成 , 但 这 种 随机 组 合 方式 可 能 会 影响 被 试 的 主观 感受 , 实验 二 以 音节 为 单位 采 
3 相同 的 规则 合成 人 工 语言 (Toro et al., 2011), 迫 选任 务 中 使 用 和 实验 一 完全 一 致 的 材料 ， 
如 果 在 实验 二 中 , 被 试 没 有 表现 出 明显 的 学 习 效 应 , 则 说 明 实 验 一 中 的 效应 完全 来 自 于 人 工 
语言 中 目标 词 所 承载 的 转换 概率 。 

2 实验 一 : 转换 概率 对 统计 学 习 效应 的 独立 作用 
2.1 方法 
2.1.1 被 试 

共有 40 名 被 试 参与 实验 ， 男 性 被 试 15 名 ， 被 试 年 龄 范围 19 一 25 岁 ， 所 有 被 试 母语 均 
为 汉语 普通 话 。 实 验 要 求 被 试 学 习 没有 接触 过 的 人 工 语言 , 为 了 排除 被 试 二 语 经验 、 音 乐 经 
验 对 实验 结果 的 影响 ,所 有 被 试 均 非 外 国语 专业 和 音乐 相关 专业 ; 最 后 , 为 了 避免 被 试 猜测 
实验 目的 ， 排 除了 心理 学 专业 学 生 。 实 验 前 ， 被 试 签署 知情 同意 书 ， 实 验 结束 后 被 试 获 取 少 


量 报酬 ， 本 研究 经 过 校 伦理 委员 会 审查 (X X X 2022060023). 


cian 
~ 


2.1.2 实验 设计 


采用 学 习 -测试 范式 考察 被 试 的 语音 统计 学 习 能 力 ， 实 验 设计 为 2〈 词 长 : 两 音节 ， 三 音 
节 ) X3《〈 迫 选 对 类 型 : 


目标 词 和 跨 界 词 迫 选 对 ， 目 标 词 和 非 词 迫 选 对 ， 跨 界 词 和 非 词 迫 选 


对 ) 的 被 试 内 设计 。 在 具体 的 分 析 中 ， 首 先 检验 被 试 在 迫 选 对 上 的 正确 率 与 随机 水 平 (0.5) 


的 差异 性 ， 随 后 i 


行 方 


2.1.3 材料 和 实验 程序 
在 学 习 阶段 ,由 10 个 音节 构造 目标 词 来 合成 人 工 语言 ,所 有 音节 均 来 自 于 文 描 等 (2021b) 


的 研究 ， 由 一 名 女性 普 


差分 析 检 验 转换 概率 的 独立 效应 。 


通话 母 


oH 
Àk 


录制 ， 经 过 标准 化 后 音节 时 长 300ms， 强 度 704B， 基 频 


266Hz。 参考 以 往 研究 设计 , 这 些 音节 在 普通 话 第 一 声 声 调 下 无 意义 , 随后 将 10 个 音节 随机 


组 成 4 个 目标 词 (Gomez et al., 2017; 于 文 勃 等 ，2021lb)， 音 节 和 音节 之 间 没 有 任何 时 间 间 


隔 。 根 据 以 往 统计 学 习 实 验 的 要 求 (Saffran etal., 1996)， 按 照 伪 随 机 的 方式 拼接 人 工 语言 ， 


其 


其 中 每 个 目标 词 后 不 能 立刻 出 现 该 目标 词 ， 并 且 出 丙 


见 其 他 目标 词 的 概率 相同 (本 研究 中 为 


日 


1/3 ), 在 人 工 语 = 


每 个 目标 词 出 现 100 次 , 保证 人 工 语言 前 后 两 段 目标 词 均 匀 分 布 ， 人 工 


语言 时 长 5 分 钟 。 随后, 分 别 合成 跨 界 词 和 非 词 各 4 个 ,前 者 要 求 目标 词 包括 前 后 相连 两 个 


目标 词 的 部 分 音节 ， 具 有 一 定 的 转换 概率 ， 后 者 要 求 词 内 音节 不 会 相连 出 现在 人 工 语言 中 ， 


因此 转换 概率 为 0。 编 
存在 差异 , 因此 每 个 迫 选 对 均 是 由 相同 长 度 的 选项 构成 , 同时 还 要 将 两 个 选项 调换 顺序 呈现 


判 迫 选 对 过 程 中 ， 为 了 保证 每 一 个 迫 选 试 次 内 的 选项 仅 在 转换 概率 上 


两 次 ， 以 排除 选项 顺序 对 实验 结果 的 影响 。 人 迫 选 对 中 的 六 类 词 的 转换 概率 、 在 人 工 语言 中 的 


频次 如 表 1。 


词类 


wr. -二 十 


日 


标 词 
跨 界 词 
两 音节 非 词 


Wa 
两 音节 


音节 目标 词 
三 音节 跨 界 词 


三 音节 非 词 


表 1 实验 中 六 类 选项 的 转换 概率 和 频次 


词 词 频 转换 概率 
remei, rouse 100 1 
meirou, sere 33 0.33 
refo, rouruo 0 0 

nueruote, diafolai 100 1 
tediafo, lainueruo 33 0.67 
nuemeilai, diasete 0 0 


实验 程序 由 E-prime 呈现 , 被 试 佩戴 耳机 完成 , 电脑 音量 由 被 试 自主 调节 , 在 30%~40% 


CH 


范围 内 。 实 验 程 序 包 括 练 习 实验 和 正式 实验 ， 练 习 实 验 前 由 主 试 讲解 实验 要 求 和 指导 语 , HA 
Mi Ss 中 的 人 工 语言 ， 随 后 呈现 3 个 迫 选 试 次 帮助 被 试 了 解 实验 流程 ， 练 习 实验 中 的 材料 
在 正式 实验 中 不 会 出 现 。 正 式 实验 被 试 需要 学 习 人 工 语言 5 分 钟 ,随后 完成 24 个 迫 选 试 次 ， 


TT 


每 个 迫 选 试 次 中 ， 两 个 选项 仍旧 采用 音频 的 方式 播放 ， 中 间 间 隅 500ms， 全 部 播放 结束 后 ， 
屏幕 呈现 提示 语 ， 要 求 被 试 从 听 到 的 两 个 词语 中 选择 更 为 熟悉 的 那个 ， 按 “1 ”或 “2” 键 进 
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行 选择 。 实 验 全 程 大 约 需 要 10 分 钟 ， 流 程 示意 图 如 图 2。 


CY ...-ABC-DE-GH-JKL-ABC-JKL-DE-ABC-DE-... 


你 觉得 哪个 词 更 熟悉 ?| | 你 觉得 哪个 词 更 熟悉 ? | | 你 觉得 哪个 词 更 熟悉 ? 


测试 阶段 L Bhi r: Bhd 1: Bid 
Q 2: pfi Q 2: AFi Q 2: Api 


目标 词 和 跨 界 词 迫 选 对 目标 词 和 非 词 迫 选 对 跨 界 词 和 非 词 迫 选 对 


图 2 实验 流程 示意 图 


2.2 结果 
2.2.1 混合 词 长 条 件 下 的 统计 学 习 效应 

在 统计 学 习 研 究 中 ， 首 先 要 通过 迫 选 正确 率 和 随机 水 平 的 差异 比较 来 判断 被 试 是 否 实 
现 了 统计 学 习 , 跨 界 词 和 非 词 都 不 是 被 试 所 要 学 习 的 人 工 词语 , 在 本 研究 中 的 前 两 种 迫 选 对 
类 型 中 它们 都 是 错误 答案 ; 不 过 ,在 跨 界 词 和 非 词 迫 选 对 中 ， 由 于 跨 界 词 的 转换 概率 更 高 且 
在 人 工 语言 中 出 现 了 一 定 的 次 数 , 因此 如 果 相 比 于 非 词 被 试 能 够 更 多 地 选择 跨 界 词 , 则 也 说 
明 被 试 进行 了 统计 学 习 。 
单 样本 T 检验 结果 表明 ， 被 试 在 目标 词 和 跨 界 词 迫 选 对 中 ， 迫 选 正确 率 边 缘 显著 高 于 
随机 水 平 ，! (39) =1.97, p= 0.056，M=0.57， 差 异 的 95%CI:: [-0.00, 0.14], d=0.31, 
在 目标 词 和 非 词 迫 选 对 中 ， 迫 选 正确 率 显 闭 高 于 随机 水 平 ，! (39) = 4.53, p< 0.001, M= 
0.63, AFA 95%CI:: [0.07，0.19]，qd = 0.72， 在 跨 界 词 和 非 词 迫 选 对 中 ， 人 迫 选 正确 率 边 缘 


显著 高 于 随机 水 平 ，! (39) =1.86, p=0.070，M=0.55， 差 异 的 95%CI:: [-0.00, 0.10], d 


=0.23。 被 试 的 总 体 正 确 率 显著 高 于 随机 水 平 ，! (39) =3.71, p<0.001, M=0.55, ARN 
95%CI:: [0.04,0.13]，d= 0.39。 以 上 结果 表明 ， 被 试 在 学 习 过 程 中 已 经 能 够 对 有 转换 概率 的 
结构 (目标 词 和 跨 界 词 进行 记忆 表征 ， 表 现 出 统计 学 习 效应 ， 如 图 3. 


1.00] 
0.754 
Œ 0.505 
i 
0.254 


0.004 . . 


目标 词 ERA EA 跨 界 词 ea FEB 
图 3 混合 词 长 条 件 下 的 统计 学 习 效应 
2.2.2 转换 概率 对 学 习 效 应 的 影响 
两 因素 被 试 内 方差 分 析 显 示 ， 人 迫 选 对 类 型 主 效应 边缘 显著 (F (1.75, 68.13) = 3.15, 


p=0.056, 172=0.02), KERRIES CF, 39) = 1.39,，p = 0.245)， 迫 选 对 类 型 和 


词 长 交互 作用 显著 CF (1.83, 71.31) =4.80, p=0.013，n ?= 0.03)。 对 人 迫 选 对 词类 的 主 效 
心事 后 检验 表明 ,被 试 在 目标 词 和 非 词 的 迫 选 对 上 的 正确 率 显 著 高 于 跨 界 词 和 非 词 (1(39)= 
2.68, p=0.032)。 两 个 因素 交互 作用 的 简单 效应 分 析 表 明 ， 在 目标 词 和 跨 界 词 迫 选 对 中 ， 两 
音节 条 件 下 的 正确 率 边 缘 显 著 高 于 三 音节 条 件 (1 (39) = 1.71，p = 0.095)， 但 在 跨 界 词 和 非 
词 条 件 下 ， 两 音节 条 件 下 的 正确 率 显 著 低 于 三 音节 条 件 (1 (39)= -2.60, p=0.013)， 在 目标 
词 和 非 词 迫 选 对 中 ， 词 长 的 简单 效应 不 显著 (1 (39) =-1.35, p=0.185)。 此 外 ， 在 两 音节 词 
长 条 件 下 ， 目 标 词 和 跨 界 词 迫 选 对 (1 (39) = 2.34, p= 0.093) 以 及 目标 词 和 非 词 迫 选 对 (1 
(39) = 2.52，p = 0.048) 的 正确 率 都 〈 边 缘 ) 显著 高 于 跨 界 词 和 非 词 迫 选 对 。 在 三 音节 条 件 
下 ， 仅 有 目标 词 和 路 界 词 迫 选 对 的 正确 率 显 著 低 于 目标 词 和 非 词 迫 选 对 (1 (39) =-2.72, p= 
0.029), 其 他 条 件 差异 未 达到 显著 水 平 , 以 上 分 析 中 , 涉及 到 三 个 及 三 个 水 平 以 上 的 检验 时 ， 
均 采 用 了 bonferroni 矫正 。 被 试 在 六 种 迫 选 对 下 的 正确 率 和 标准 差 如 表 2 和 图 4。 


= 


表 2 三 类 迫 选 对 的 正确 率 和 标准 差 


目标 词 和 跨 界 记 目标 词 和 非 词 跨 界 词 和 非 记 
两 音节 三 音节 两 音节 三 音节 两 音节 三 音节 

M 0.61 0.53 0.60 0.66 0.49 0.61 
实验 一 

SD 0.27 0.28 0.23 0.24 0.20 0.23 

M 0.55 0.49 0.41 0.52 0.49 0.43 
实验 二 

SD 0.26 0.22 0.27 0.22 0.23 0.24 


值得 注意 的 是 , 被 试 在 三 音节 目标 词 和 跨 界 词 迫 选 对 和 两 音节 跨 界 词 和 非 词 迫 选 对 上 的 
正确 率 均 与 随机 水 平 差异 不 显著 ，! (39) =0.57, M=0.53, p=0.570, t (39) =-0.40, M= 


0.49, 也 = 0.689， 这 两 个 结果 说 明 被 试 在 这 些 类 迫 选 对 上 没有 表现 出 学 习 效应 。 


目标 词 跨 界 词 目标 词 非 词 跨 界 词 非 词 
T * 
o 
0.94 
e 
s 0.64 
m ce 
0.34 
© 
0.04 e e. e e 
HEH 音节 两 音节 = 音节 两 音节 三 音节 
图 4 转换 概率 对 学 习 效应 的 影响 


2.3 实验 一 讨论 

在 目标 词 和 跨 界 词 以 及 跨 界 词 和 非 词组 成 的 迫 选 对 中 ， 被 试 的 迫 选 正确 率 均 在 0.55 上 
下 ， 和 随机 水 平 差异 边缘 显著 ; 但 被 试 在 目标 词 和 非 词 的 迫 选 对 中 ,被 试 的 迫 选 正确 率 达 到 
0.63， 显 著 高 于 随机 水 平 。 在 重复 测量 方差 分 析 中 ， 我 们 发 现 被 试 在 三 类 迫 选 对 正确 率 差异 
边缘 显著 , 尤其 是 目标 词 和 非 词 的 迫 选 对 中 正确 率 显 著 高 于 跨 界 词 和 非 词 的 迫 选 对 。 分 析 其 
原因 ， 目 标 词 、 跨 界 词 和 非 词 三 类 词 在 学 习 材料 中 出 现 的 频次 和 转换 概率 逐渐 下 降 ， 从 统计 


T 


学 习 的 记忆 模型 来 看 (Thiessen & Erik, 2017; Lukics & Lukacs, 2021; Isbilen et al., 2020; 2022), 
高 转换 概率 的 结构 也 就 是 目标 词 , 在 人 工 语 言 中 出 现 频次 更 多 , 被 试 有 更 多 的 机 会 对 它们 进 
行 表征 ; 而 跨 界 词 在 人 工 语言 中 出 现 频 次 较 低 ， 转 换 概 率 也 相对 较 低 ， 被 试 对 它们 的 记忆 表 


征 相 对 较 弱 ;最 后 ， 非 词 并 未 


现在 人 


[语言 中 ， 因 此 被 试 对 它们 的 熟悉 度 或 再 认可 能 性 都 


最 低 ， 这 些 原因 共同 导致 了 被 试 在 不 同类 型 迫 选 对 的 正确 率 存在 一 定 的 差异 。 


I 


相 比 于 以 往 丰 


究 ， 实 验 一 在 实验 材料 上 ; 


行 了 改进 ， 两 音节 跨 界 词 和 三 音节 跨 界 词 的 


转换 概率 并 不 相同 〈 两 音节 : 0.33， 三 音节 : 0.67)， 但 它们 在 人 工 语 言 中 出 现 的 频次 相同 。 


当 它 们 分 别 和 长 度 相 同 的 目 
们 再 比较 两 种 长 度 迫 选 试 次 的 正 而 


标 词 进行 迫 选 时 , 虽然 在 转换 概率 和 词 频 上 都 有 差别 , 但 是 当 我 


角 率 时 ， 则 只 m 


转换 概率 上 存在 差异 . 相 比 于 三 音节 跨 界 词 ， 


音节 跨 界 词 的 转换 概率 较 低 , 它们 对 两 音节 


出 两 音节 目标 词 ， 


界 词 的 迫 选 对 。 同 理 ， 两 音节 跨 界 词 转换 概率 较 低 ， 


AGM eS Fa] POSE al i aE TED 
一 步 说 明 当 词 频 差异 


在 实验 二 中 


目标 词 造成 的 干扰 较 小 , 被 试 可 以 轻松 地 选择 
因此 两 音节 目标 词 和 跨 界 词 迫 选 的 正确 率 边缘 显著 高 于 三 音节 目标 词 和 跨 


三 音节 跨 界 词 转换 概率 较 高 ， 因 此 后 者 


在 和 非 词 〈 转 换 概率 为 0， 词 频 也 为 0) 进行 配对 时 ， 被 试 较 容 易 进行 选择 出 正确 答案 ， 最 


固定 时 ， 转 换 概率 能 够 影 


响 学 


外 率 显著 高 于 两 音节 条 件 。 因此, 实验 一 交互 作用 结果 进 
习 效 应 。 


， 我 们 以 音节 为 单位 合成 人 工 语言 ， 采 用 相同 的 迫 选 材料 进行 实验 。 如 果 


被 试 是 因为 对 目标 词 或 跨 界 词 有 偏好 ， 忆 


他 们 选择 正确 答案 的 可 能 应 不 


g 么 他 们 仍旧 会 表现 出 明显 的 “学 习 效应 ” 相反 ， 
馈 过 随机 水 平 (0.5)。 


3 实验 二 : 随机 人 工 语言 的 学 习 效 应 检验 


3.1 方法 


3.1.1 被 试 


范围 为 19 一 26 岁 
据 进 入 分 析 。 


3.1.2 实验 设计 


we 


招募 被 试 的 标准 同 实 验 一 ， 共 有 38 名 被 试 参与 实验 二 ， 其 中 男性 被 试 10 名 , 被 试 年 龄 


。 由 于 实验 程序 问题 ， 一 名 被 试 的 数据 被 覆盖 ， 最 终 有 37 名 被 试 的 行为 数 


仍旧 采用 学 习 -测试 范式 考察 被 试 的 语音 统计 学 习 能 力 ， 实 验 自 变 量 和 因 变 量 同 实验 一 
保持 一 致 。 由 于 人 工 语言 以 音节 为 单位 合成 , 所 有 目标 词 和 跨 界 词 在 学 习 阶 段 中 的 转换 概率 


均 较 低 , 不 应 该 导致 学 习 效 应 。 迫 选 全 
言 条 件 下 是 否 对 之 前 的 正确 答案 有 


3.1.3 材料 和 实验 程序 


实验 二 中 学 习 阶 段 的 人 工 语言 以 实验 一 中 的 10 个 无 意义 音节 为 单位 合成 , 每 个 音 


不 能 重复 出 现 该 音节 ， 可 以 是 其 他 9 个 音节 中 的 任 


E 务 中 以 实验 一 的 答案 作为 标准 检验 被 试 在 随机 人 工 语 
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E 验 的 语言 偏好 。 


im 


45 
意 一 个 ， 最 终 ， 人 工 语言 由 1000 个 音节 


超过 20 


拼接 而 成 。 实验 二 的 迫 选 试 次 和 实验 一 完全 一 致 , 经 过 计算 所 有 选项 在 人 工 语言 出 现 频 次 不 


次 ， 所 占 比 例 非常 低 。 实 验 程序 和 实验 一 保持 一 致 ， 由 E-prime 呈现 ， 包 括 练习 实 


验 和 正式 实验 ， 时 间 约 10 分 钟 。 
结果 


=-1.59, 


单 样本 工 检验 结果 显示 , 被 试 在 所 有 试 次 上 的 迫 选 正确 率 未 显著 高 于 随机 水 平 , 1 (36) 


M=048, p=0.121,; 此 外 ， 被 试 在 目标 词 和 跨 界 词 迫 选 对 中 ， 迫 选 正 确 率 未 显著 


高 于 随机 水 平 ，t (36) =0.61, M=0.53, p=0.549， 在 目标 词 和 非 词 迫 选 对 中 ， 迫 选 正 确 率 


高 于 随机 水 平 ，t (36) =-1.23，M=0.46,，p = 0.226， 在 跨 界 词 和 非 词 迫 选 对 中 ， 迫 


选 正确 率 未 显著 高 于 随机 水 平 ，! (36) =-1.54，M= 0.53，p = 0.133 。 随 后 ， 结 合 词 长 变量 


检验 被 试 在 六 种 条 件 下 是 否 表现 出 明显 的 学 习 效 应 , 结果 发 现 被 试 的 迫 选 正确 率 均 未 显著 高 


于 随机 水 平 (p.s. > 0.05)， 正 确 率 和 标准 差 如 表 2。 


3.3 实验 二 讨论 


实验 二 以 音节 为 单位 合成 人 工 语 言 作 为 学 习 材 料 , 考察 缺失 转换 概率 因素 时 被 试 是 否 对 


实验 一 


的 “答案 ”仍旧 表现 出 更 高 的 熟悉 性 ， 结 果 发 现 无 论 在 总 体 还 是 六 种 水 平 下 被 试 的 


迫 选 正确 率 均 未 显著 高 于 随机 水 平 ， 这 说 明 实验 一 中 的 学 习 效应 不 是 来 自 于 被 试 对 目标 词 、 
跨 界 词 的 先 验 语言 经 验 ， 而 是 来 自 于 学 


习 阶 段 对 转换 概率 信息 的 习 得 。 


4 总 讨论 


以 往 的 统计 学 习 研 究 中 , 注重 检验 个 体能 否 依靠 统计 信息 实现 统计 学 习 或 词 切 分 , 较 少 
关注 个 体 对 哪些 统计 信息 进行 了 利用 。 本 研究 的 目的 在 于 考察 转换 概率 高 低 是 否 会 影响 被 试 
的 学 习 效 应 ， 从 而 验证 其 对 统计 学 习 效应 的 独立 贡献 。 实 验 一 中 ,我 们 设置 了 不 同 长 度 的 目 


标 词 、 跨 界 词 和 非 词 , 结果 发 现 被 试 能 够 较 好 地 完成 迫 选 任务 , 表现 出 统计 学 习 效应 ; 同时 ， 
不 同类 型 迫 选 对 中 选项 间 转 换 概 率 的 差异 确实 影响 被 试 的 迫 选 正 确 率 。 实 验 二 中 , 我 们 通过 
以 音节 为 单位 编制 的 人 工 语言 发 现 被 试 在 实验 一 中 所 表现 出 的 学 习 效应 并 非 来 自 对 无 意义 
目标 词 和 跨 界 词 的 先 验 偏好 。 结合 两 个 实验 结果 , 说 明 转 换 概率 能 够 独立 于 词 频 影响 语音 统 


wea 


E 务 的 结果 。 


4.1 统计 学 习 效 应 


经 典 的 统计 学 习 任 务 为 了 验证 个 体能 否 仅 依靠 音节 间 的 转换 概率 来 实现 语 流 切 分 ， 通 


常 只 选 月 


日 两 音节 词 (Mirman et al., 2008; Gomez et al., 2017; Estes et al., 2015) 或 三 音节 词 


(Saffran et al., 1996; Wang & Saffran, 2014) 来 合成 人 工 语言 。 但 近年 来 ,一些 学 者 提出 ,为 


了 更 好 地 贴近 自然 语言 中 词 长 不 等 的 情况 (Frost et al., 2020; Saffran & Kirkham, 2018)， 同 时 
避免 韵律 期 竺 效应 (Hoch etal.,2013)， 应 该 使 用 长 度 不 等 的 词语 合成 实验 材料 (FICHE, 
2021b)。 在 实验 一 中 我 们 发 现 被 试 在 所 有 人 迫 选 试 次 下 的 正确 率 显 著 高 于 随机 水 平 ， 达 到 了 


0.358， 仍 旧 表 现 出 了 学 习 效 应 ， 与 以 往 研 究 结 果 一 致 (Palmer & Mattys, 2016; Gómez et al., 


>` 


2017; Estes etal., 2015; 于 文 勃 等 ，2021b)， 说 明 即 使 在 较为 复杂 的 语言 环境 下 ， 个 体 仍 旧 


可 以 通过 追踪 语言 内 部 的 概率 信息 实现 词语 切 分 。 实 验 一 的 设计 更 进一步 地 验证 记忆 模型 在 


解释 统计 学 习 效应 的 合理 性 。 如 表 1 


和 图 4 所 示 , 我 们 采用 了 六 类 词语 组 成 迫 选 对 ,结果 发 


现 被 试 在 转换 概率 和 词 频 差 异 较 大 的 迫 选 对 中 正确 率 较 高 (如 三 音节 目标 词 和 非 词 迫 选 对 )， 


而 在 差异 较 小 的 迫 选 对 中 正确 率 较 低 ， 甚 至 和 随机 水 平 差异 不 显著 《如 两 音节 跨 界 词 和 两 音 


节 非 词 )。 相 比 于 以 往 研 究 ， 本 研究 为 统计 学 习 的 记忆 模型 理论 提供 了 更 精细 的 实验 证 据 。 


4.2 转换 概率 的 独立 效应 
统计 学 习 的 理论 源 来 自 于 Harris 


(1954, 1955) 对 自然 口语 中 语素 分 布 规律 的 归纳 ， 作 


者 认为 个 体 可 以 通过 发 现 程序 习 得 语言 或 切 分 语 流 , 而 发 现 程序 的 关键 就 是 对 语 流 中 的 统计 
言 息 进行 加 工 。 虽 然 词 频 和 转换 概率 都 可 以 被 看 成 概率 信息 ,但 是 它们 二 者 有 着 本 质 的 区 别 。 


对 于 高 转换 概率 的 音节 组 合 , 前 一 个 


音节 可 以 预测 后 一 个 音节 的 出 现 , 但 对 于 高 频次 的 音节 


组 合 来 说 ,它们 的 转换 概率 可 能 并 不 
出 现在 语言 环境 中 ， 所 以 转换 概率 更 


高 ， 即 前 一 个 音节 也 可 能 和 其 他 音节 组 成 词 ， 并且 多 次 
能 够 作为 判断 语 流 中 词 边 界 的 因素 。 本 研究 中 ,虽然 在 


目标 词 和 跨 界 词 的 迫 选 中 , 两 音节 条 件 只 是 边缘 显著 高 于 三 音节 条 件 , 而 且 效 应 量 也 未 达到 
中 等 程度 ,但 单 样本 了 检验 的 结果 显示 被 试 的 三 音节 迫 选 正确 率 (0.53) 与 随机 水 平 差异 不 


显著 , 这 说 明 在 这 种 条 件 下 已 经 没有 


了 学 习 效 应 , 被 试 难以 分 辨 三 音节 目标 词 和 三 音节 跨 界 


词 的 区 别 ， 相 应 的 ， 在 两 音节 人 迫 选 任务 中 学 习 效应 仍旧 稳定 《正确 率 达 到 0.61)， 说 明 在 这 


种 迫 选 类 型 下 被 试 能 够 很 好 地 区 分 目 


标 词 和 跨 界 词 。 因 此 从 被 试 的 学 习 效果 来 看 可 以 认为 在 


词 频 被 控制 后 ， 音 节 间 的 转换 概率 仍旧 能 够 影响 语音 统计 学 习 效应 。 


Endress 和 Mehler (2009) 在 人 了 


[语言 中 设置 了 “幽灵 词 ” 这 些 词 虽 然 没 有 以 音节 组 合 


Ht 


rea 


PREIE, 但 是 音节 间 的 转换 概 


率 和 目标 词 相同 , 实验 结果 显示 被 试 对 幽灵 词 和 目标 词 


的 迫 选 正 确 率 与 随机 水 平 差 异 不 显著 , 但 被 试 对 幽灵 词 的 喜好 程度 高 于 跨 界 词 。 这 一 结果 说 
明 被 试 首 先是 以 转换 概率 作为 词语 切 分 和 存储 的 标准 ， 随 后 才 是 频次 等 信息 (Perruchet & 


Poulin-Charronnat, 2012)。 统 计 学 习 中 转换 概率 的 独立 作用 在 自然 语言 中 也 可 以 找到 证 据 。 


口语 语 流 中 缺少 明确 的 词 间 边界 ， 因 


此 音节 间 的 统计 信息 对 于 词 切 分 尤为 关键 。 在 英语 口语 


语料库 ! 中 “there is” FI “there are” 在 每 百 万 词 中 出 现 的 频次 高 达 458.6 和 433.82， 二 者 都 
是 高 频 结构 ; 但 “there” 后 出 现 “is” 的 可 能 并 不 高 2， 即 音节 间 的 转换 概率 不 高 。 虽 然 “there 
is” 具 备 很 高 的 频次 ,但 由 于 转换 概率 不 高 ， 所 以 更 可 能 被 切 分 成 两 个 单词 而 非 一 个 单词 的 
两 个 词 内 音节 。 
4.3 研究 启示 

本 研究 结果 有 助 于 思考 语言 使 用 视角 下 的 汉语 词 边界 问题 。 从 语言 学 角度 看 , 词 的 定义 
是 能 够 独立 运用 的 最 小 音义 结合 体 ， 它 不 仅 是 个 体 在 头脑 中 存储 的 基本 单位 ， 还 是 在 构造 句 
子 过 程 中 不 可 再 拆 分 的 结构 。 在 英语 中 , 语言 学 意义 上 的 词 和 个 体 头 脑 中 的 词 概念 一 一 对 应 ， 
da, apply, red 既是 从 语法 角度 划分 的 词 也 是 语言 使 用 角度 最 直接 感受 到 的 词 结构 。 汉 语 
普通 话 中 ， 在 语法 的 界定 中 ,“ 打 球 ””“ 心 软 ” 的 结构 是 短语 或 词组 ， 但 对 普通 话 母 语 者 来 
说 这 些 结构 在 心理 上 是 词 ?;， 例 如 Cai 等 人 (2010) 通过 建立 电视 连续 剧 字幕 语料库 统计 汉 

口语 词 频 信 息 ， 就 包括 了 “打球 ” “吃饭 ”这 些 词组 结构 的 词 频数 据 。 在 音节 “ 打 ” 后 还 
可 能 出 现 音 节 “ 支 ”了 ”“ 听 ””“ 中 ””“ 入 ”“ 电 话 ” 等 连 谓 、 动 补 和 动 宾 等 结构 ， 事 实 上 ,“ 打 
BR” 结构 中 两 个 音节 间 的 转换 概率 并 不 高 , 既然 本 研究 发 现 口语 加 工 中 前 一 个 音节 对 后 一 个 
音节 的 预测 性 (转换 概率 ) 能 够 影响 大 脑 对 词 边界 的 识别 ， 那么 在 类 似 结构 中 个 体 很 可 能 只 
将 “ 打 ” 切 分 出 来 作为 一 个 结构 单位 加 工 4, 而 不 是 将 “打球 ”作为 一 个 整体 进行 加 工 。 本 研 
究 的 结果 能 够 为 汉语 词 边界 划分 在 语言 学 理论 和 语言 使 用 视角 下 的 不 统一 问题 提供 参考 。 


五 


5 结论 


本 研究 发 现 ， 当 词 频 固 定时 ， 转 换 概率 仍旧 能 够 影响 统计 学 习 的 效应 ， 被 试 仍旧 可 以 
识别 出 高 转换 概率 的 目标 词 或 跨 界 词 ,说明 转换 概率 对 统计 学 习 的 影响 在 一 定 程度 上 独立 于 


1 数据 来 源 : British National Corpus Online service，http:/bncweb.lancs.ac.UK 

2 在 口语 中 ，their 和 there 的 发 音 相同 ， 因 此 /6e39/ 后 出 现 的 音节 种 类 更 多 ， 进 一 步 降 低 了 there is 的 转换 概 

率 。 

3 在 相关 研究 中 ， 有 学 者 称 之 为 主观 词 ( 闫 国 利 等 ，2013)、 离 合 词 ( 朱 佳 琵 ， 刘 凤 榴 ，2020;， 庞 加 交 ， 

JKH, 2022) 或 韵律 词 ( 裴 雨 来 ，2016)。 

4 Cai (2010) 等 人 的 文章 中 包括 了 “ 打 ” 作 为 一 个 词 的 词 频 信息 。 
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The independent effect of transitional probability on verbal statistical 


learning 


Abstract: In a typical SL task, participants are first exposed to a nonsensical artificial language for 
5~10 mins and then asked to finish a 2 alternative forced choice task (2AFC). Transitional 
probabilities (TPs), the core concept in SL, represent the predictably between syllables. In a given 
artificial language, syllables within a target word occur together more frequently, resulting in higher 
TPs than those of the syllables that span across word boundaries. The latter is referred to as 
partwords and consist of lower TPs. After the exposure phase, participants enter the test phase and 
are presented with a partword and target word in each trial of the 2AFC task. If the accuracy across 
participants is higher than chance level, it is assumed that learning has occurred. However, studies 
have also shown that factors other than TPs, such as word token frequency, word length variations 
(or the lack thereof) also impact SL performance in such tasks. To date, these factors as well as their 
interactive effects remain under studied. 

In the experiment one, we aimed to investigate whether TPs affect SL learning performance 
when controlling for target words’ and partwords’ token frequencies. In doing so, we created the 
artificial language by randomizing the order of two trisyllabic words and two disyllabic words. 
During the 2AFC task, three types of items (target word, partword, and nonword) were paired 
together, with two items in equal length in each trial. There were 24 trials in the test. 40 native 
Mandarin monolinguals participated in the experiment; they first listened to the artificial language 
for 5mins and then finished the 2AFC task. In the experiment two, an artificial language was 
generated with 10 syllables and presented in exposure phase, to examine whether experiment one’s 
learning effect came from the TP or participants’ prior language bias. 

Results in experiment one showed that the accuracy of all trials was significantly higher than 
chance (0.5) at the group level, suggesting that participants were able to segment the artificial 
language of mixed word lengths. Participants were also marginally better at choosing target words 
over partwords, and partwords over nonwords. To investigate the independent effect of TP in SL, 
we subset the data by word length and found that participants’ accuracy choosing trisyllabic target 
words over partwords was marginally lower than their choosing disyllabic target words over 
partword, which suggests that disyllabic words confer advantage in SL for this group of participants. 
In addition, participants’ accuracy in choosing trisyllabic partwords over nonwords was 
significantly higher than that of disyllabic target partwords over nonwords. In the experiment two, 
there were no significant learning effect in any levels when the statistical information was absent. 

A series of results across two behavior experiments highlight the unique contribution from TPs 


alone, since accuracy was assessed by controlling for word token frequency and word length. Thus, 
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the present study suggests that TP exerts effect on verbal SL performance independent of word token 
frequency. Further studies should take into account more types of statistical rule such as mutual 
information and backward TP. 


Key words: transitional probability; tokens; statistical learning; 2-alternative forced choice task 
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